اندیشە آماري سال بیست و یکم شمارة اول بهار و تابستان 1395 شمارة پیاپی 41 صص 87-81 81 آزمون فرضیه و بازة اطمینان دقیق براي میانگین توزیع نمایی تحت سانسور دورگە پیش روندة نوع اول 2 حسین نادب 1 و حمزه ترابی چکیده: تاریخ دریافت: 1394/8/7 تاریخ پذیرش: 1395/8/30 نمونه هاي سانسور شده در آزمایش هاي مربوط به آزمون هاي طول عمر مطرح می شوند یعنی هنگامی که آزمایشگر زمان هاي از کار افتادگی تمام واحد هاي موجود در آزمون طول عمر را مشاهده نمی کند. در سال هاي اخیر استنباط بر پایە نمونه هاي سانسور شده بسیار مورد توجه قرار گرفته است به طوري که در مورد پارامتر هاي توزیع هاي مختلفی مانند نرمال نمایی گاما رایلی وایبول لگ نرمال گوسی معکوس لوژستیک لاپلاس و پارتو بر اساس نمونه هاي سانسور شده استنباط صورت گرفته است. در این مقاله روشی براي انجام آزمون فرضیه و یافتن بازة اطمینان دقیق براي میانگین توزیع نمایی تحت سانسور دورگە پیش روندة نوع اول 3 پیشنهاد می شود. سپس با استفاده از شبیه سازي عملکرد بازة اطمینان پیشنهادي مورد ارزیابی قرار می گیرد. سرانجام روش هاي پیشنهادي روي یک مجموعه از داده هاي واقعی اجرا می شود. واژه هاي کلیدي: توزیع نمایی سانسور دورگە پیش روندة نوع اول آزمون فرضیه بازة اطمینان احتمال پوشش. 4 1 مقدمه در بیشتر پژوهش هاي مربوط به داده هاي طول عمر عوامل بازدارنده اي همچون زمان و هزینه باعث می شوند که آزمایش ها پیش از شکست همە واحدها به پایان برسند. به داده هاي برآمده از این آزمایش ها داده هاي سانسور شده گفته می شود. در مطالعە داده هاي سانسور شده توزیع نمایی از اهمیت بسزایی برخوردار است. اپشتاین [14] در سال 1954 سانسور دورگە نوع اول را پیشنهاد کرد. تحت این نوع سانسور توزیع نمایی بسیار مورد توجه قرار گرفت تا این که بالاکریشنان و باسو [2] در سال 1995 آن را از لحاظ نظري و کاربردي گسترش دادند. به شرط مشاهدة حد اقل یک شکست چن و بهاتاچاریا [6] در سال 1988 از روش تابع مولد گشتاور شرطی براي به دست آوردن توزیع برآوردگر ماکسیمم درست نمایی براي پارامتر مقیاس در مدل مقیاسی استفاده کردند. چایلدز و همکاران [9] در سال 2003 از همین روش براي ساده کردن تابع چگالی استفاده کردند. در مدل سانسور دورگە پیش روندة نوع اول چایلدز و همکاران [8] در سال 2008 و کوندو و ژواردر [15] در سال 2006 نیز از همین روش استفاده کردند. چایلدز و همکاران [7] در سال 2012 روشی را براي آماره هاي ترتیبی به کار بردند. آن ها نتایج خود را براي داده هاي اراي ه شده در بارلو و همکاران [3] به کار گرفتند و حدود بالایی و پایینی را براي پارامتر مقیاس به دست آوردند. سرانجام کرامر و بالاکریشنان [10] در سال 2013 توزیع دقیق برآوردگرهاي ماکسیمم درست نمایی را تحت سانسور دورگە پیش روندة نوع اول در توزیع نمایی به دست آوردند. در این مقاله با به کار گیري توزیع دقیق برآوردگر ماکسیمم درست نمایی اراي ه شده در کرامر و بالاکریشنان [10] روشی براي انجام آزمون فرضیه و به دست آوردن بازه اطمینان براي میانگین توزیع نمایی پیشنهاد می شود. 3 Type-I progressive hybrid censoring 1 دانشجوي دکتراي آمار دانشگاه یزد 2 عضو هیات علمی گروه آمار دانشگاه یزد 4 coverage probability
82 آزمون فرضیه و بازة اطمینان دقیق براي میانگین توزیع نمایی... حسین نادب و حمزه ترابی L(θ) = D j= γ j θ D Z (I) { exp θ D j= ( + r j )Z (I) j است: } + γ D+ t,... Z (I) D t (1) γ k = m ( + r j ). j=k به طوري که وقتی D با ماکسیمم کردن تابع L(θ) نسبت به θ داریم: ˆθ = D ( + r j )Z (I) j D j= + γ D+ t. کرامر و بالاکریشنان [10] تابع چگالی θˆ به شرط D را بر 5 به دست آوردند. قبل از آوردن تابع حسب توابع بی اسپلاین چگالی شرطی نخست تفاضلات تقسیم شده 6 و توابع بی اسپلاین را تعریف می کنیم. با استفاده از باردن و فیرز [4] تفاضلات تقسیم شده به صورت زیر تعریف می شود: تعریف 1.3. (تفاضلات تقسیم شده ) فرض کنید g تابعی باشد که مقادیرش در یک مجموعه از نقاط (گره هاي) x,..., x n معلوم یا قابل محاسبه باشد. در این جا فرض می شود که این نقاط دو به دو متمایز هستند اما نیازي به مرتب شدن بر روي خط حقیقی ندارند. تفاضلات تقسیم شدة اول بین x i و x i+ به صورت زیر g[x i, x i+ ] = g(x i+) g(x i ) x i+ x i. تعریف می شوند: تفاضلات تقسیم شدة دوم بین x i+ x i و x i+ چنین تعریف g[x i, x i+, x i+ ] = g[x i+, x i+ ] g[x i, x i+ ] x i+ x i, می شوند: و سرانجام تفاضل تقسیم شدة nام بین x x... و x n به کمک g[x,..., x n ] = g[x,..., x n ] g[x,..., x n ] x n x. از در این مقاله تفاضل تقسیم شدة nام تابع g بین نقاط x x... و x n مورد نظر است که با نماد } n {g(.) : x,..., x 5 B-Spline 6 divided differences 2 سانسور دورگە پیش روندة نوع اول فرض کنید n واحد آزمایشی در یک آزمون طول عمر قرار دارند. در زمان رخداد نخستین شکست r واحد از n واحد باقی مانده به طور تصادفی از آزمایش حذف می شوند. سپس در زمان رخداد دومین شکست r واحد از n r واحد باقی مانده به طور تصادفی از آزمایش حذف می شوند. به همین ترتیب آزمایش تا لحظە ) m:m:n T = min(t, X ادامه می یابد که t (زمان آستانه اي) مقداري ثابت معلوم و از پیش تعیین شده و X m:m:n زمان رخداد mامین شکست است که m نیز مقداري ثابت معلوم و از پیش تعیین شده است. در این طرح سانسور تعداد شکست هاي مشاهده شده با D نشان داده می شود و یک t سانسور متغیر تصادفی است. واضح است که اگر دورگە پیش روندة نوع اول به سانسور پیش روندة نوع دوم تبدیل فرض کنید X :m:n,..., X m:m:n یک نمونە سانسور شدة می شود. پیش روندة نوع دوم با بردار حذفیات ) m r = (r,..., r از جامعه اي با تابع توزیعF باشد. متغیرهاي تصادفی (I) X و D را به صورت زیر تعریف می کنیم:,..., X m (I) X (I) j = min(x j:m:n, t ), j m, m D = I (,t ](X j:m:n ), j= که D همان تعداد شکست هاي مشاهده شده است. واضح است که D داراي تکیه گاه m} {,..., است. 3 تابع درست نمایی و برآورد فرض کنید جامعە مورد نظر داراي توزیع نمایی با میانگین θ (Exp(θ)) باشد. کرامر و بالاکریشنان [10] تابع درست نمایی پارامتر θ برآوردگر ماکسیمم درست نمایی پارامتر θ و تابع چگالی θˆ به شرط D را به دست آوردند که در این بخش به مرور آن ها می پردازیم. (I) Z آماره هاي ترتیبی تحت سانسور,..., Z (I) D فرض کنید دورگە پیش روندة نوع اول با زمان آستانه اي t از جامعه اي با توزیع Exp(θ) باشند. تابع درست نمایی پارامتر θ به صورت زیر
اندیشە آماري سال بیست و یکم شمارة اول بهار و تابستان 1395 شمارة پیاپی 41 صص 87-81 83 H : θ θ H : θ < θ (4) H : θ = θ H : θ θ. و و (5) با استفاده از تابع درست نمایی (1) داریم: L(θ ) L(θ ) = (θ ) D e D( θ θ )ˆθ. θ روشن است که عبارت بالا براي هر θ > θ > تابعی صعودي از θˆ است. پس این خانواده در θˆ داراي ویژگی MLR است. اکنون آزمون (3) را در نظر بگیرید. بنا بر قضیە کارلین- روبین در کسلا و برگر [5] آزمونی با ناحیە رد θˆ > k یک آزمون UMP سطح α است که مقدار k با حل معادلە زیر به دست می آید: α = P θ (τ > k D ) m d = γ j t d e nt.θ (d )!θ d d= j= B d (dt γ d+ t,..., γ t ) e dt.θ dt. (6) k با استدلالی مشابه آزمونی با ناحیه رد θˆ < k یک آزمون UMP سطح α براي انجام آزمون (4) است که مقدار k با حل معادلە α = e nt.θ m d d= j= γ j زیر به دست می آید: t d (d )!θ d k B d (dt γ d+ t,..., γ t ) e dt.θ dt. توجه کنید که معادلات به دست آمده جواب صریح ندارند اما با معلوم بودن تمام پارامتر ها می توان آن ها را با نرم افزار هاي قدرتمند ریاضی مانند Mathematica حل کرد. اکنون آزمون (5) را در نظر بگیرید. براي انجام دادن این آزمون آزمون هاي زیر را در نظر بگیرید: H : θ = θ H : θ < θ (7) H : θ = θ H : θ > θ (8) نمایش داده می شود و با توجه به علی [1] به صورت زیر به دست می آید: و {g( ) : x,..., x n } = n i= g(x i ) n j=,j i (x i x j ). تعریف 2.3. (بی اسپلاین) فرض کنید } j t = t} دنباله اي غیر نزولی (متناهی یا نا متناهی) باشد. jامین بی اسپلاین (نرمال شدة) مرتبە k براي گره هاي دنبالە t با نماد B j,k,t نشان داده می شود B j,k,t (x) = (t j+k t j ) {[. x] k + و به صورت زیر تعریف می شود: : t j,..., t j+k }, x R, به طوري که x).[x] + = max(, تعریف اولیە (غیر نرمال) بی اسپلاین توسط کاري و شوي نبرگ [11] در سال 1966 به صورت زیر اراي ه شده است: M j,k,t (x) = k t j+k t j B j,k,t (x). براي اطلاع بیشتر در مورد توابع بی اسپلاین به [11 13] 12 مراجعه شود. پس از تعریف بی اسپلاین با استفاده از کرامر و بالاکریشنان [10] تابع چگالی θˆ به شرط D به صورت زیر بیان می شود: f ˆθ D (t) = e nt.θ m d d= j= γ j t d (d )!θ d B d (dt γ d+ t,..., γ t )e dt.θ, t, (2) که در آن ) d B d (x x,..., x نشان دهندة صفر امین بی اسپلاین غیر نرمال مرتبە d (درجە (d با گره هاي x,..., x d است B d (x x,..., x d ) = d i= که به صورت زیر ساده می شود: d[x i x] d + d j=,j i (x, x R. i x j ) 4 آزمون فرضیه در این بخش به انجام آزمون فرضیه در مورد پارامتر θ پرداخته می شود. آزمون هایی که در این مقاله مورد بحث قرار گرفته اند H : θ θ عبارت اند از: H : θ > θ (3)
84 آزمون فرضیه و بازة اطمینان دقیق براي میانگین توزیع نمایی... حسین نادب و حمزه ترابی توجه کنید که اگر α و α هر دو مخالف صفر باشند بازة اطمینان دو طرفه و اگر α = یا α = باشد بازه هاي اطمینان یک طرفه به دست می آیند. (I) Z آماره هاي ترتیبی تحت,..., Z (I) D اکنون فرض کنید سانسور دورگە پیش روندة نوع اول با زمان آستانه اي t از جامعه اي با توزیع Exp(θ) و هدف به دست آوردن بازة اطمینان با ضریب α براي θ باشد. می دانیم که خانوادة چگالی هاي مربوط در θˆ داراي خاصیت MLR است. بنابر این با به کارگیري قضایاي 1.5 و 2.5 می توان بازة اطمینان دلخواه را به دست آورد. توجه کنید که در این حالت بازه هاي اطمینان شکل صریحی ندارند و باید با نرم افزار هاي قدرتمندي مانند Mathematica محاسبه شوند. 6 مطالعات شبیه سازي در این بخش با استفاده از شبیه سازي عملکرد بازة اطمینان اراي ه شده براي پارامتر θ که در بخش پیشین اراي ه شد ارزیابی می شود. براي ارزیابی عملکرد بازة اطمینان اغلب مفهوم میانگین طول بازه و احتمال پوشش مطرح می شود. براي این منظور به ازاي m = n = و مقادیر مختلف θ و t چهار نوع طرح فرض کنید ناحیە رد آزمون (5) برابر با R و نواحی رد سانسور به کار گرفته شده است. پس از شبیه سازي نمونە سانسور شدة دورگە پیش روندة نوع اول از توزیع نمایی با میانگین θ و تعیین بازه هاي اطمینان 95 درصدي براي هر نمونه میانگین طول این بازه ها و نسبت بازه هایی که پارامتر θ را شامل می شوند (احتمال پوشش) محاسبه شده و در جدول 1 آورده شده است. همان گونه که در جدول 1 مشاهده می شود براي بردار ثابت r و مقدار ثابت θ با افزایش مقدار t میانگین طول بازة اطمینان کاهش می یابد که نتیجه اي قابل انتظار است چون با افزایش t میانگین تعداد شکست هاي مشاهده شده (D) افزایش می یابد و مشاهدات بیشتري در دسترس قرار می گیرد. با استدلالی مشابه براي بردار ثابت r و مقدار ثابت t با افزایش θ میانگین طول بازة اطمینان افزایش می یابد. همچنین مطابق انتظار احتمال هاي پوشش نیز به نزدیک هستند. R و آزمون هاي (7) و (8) به ترتیب برابر با } {ˆθ < c = } R = {ˆθ > c باشد. در آزمون (5) واضح است که زمانی فرضیە θ = θ در مقابل فرضیە θ θ رد می شود که فرضیه θ = θ در مقابل لااقل یکی از فرضیه هاي θ < θ یا θ > θ رد شود. بنابر این R. = R R اکنون فرض کنید اندازة آزمون (5) برابر با α و اندازة آزمون هاي (7) و (8) به ترتیب برابر با α و α باشد که. < α + α < در نتیجه: α = P θ (R R ) = P θ ( < c یا > c ) = P θ ( < c ) + P θ ( > c ) = α + α. بنا بر این می توان با در نظر گرفتن α = α = α به عنوان یک حالت خاص به نتیجە دلخواه رسید. 5 بازة اطمینان در این بخش در مورد بازة اطمینان براي پارامتر θ بحث می شود. براي این منظور در ابتدا دو قضیه از کسلا و برگر [5] و لهمن و رومي و [16] بیان می شود. قضیە 1.5. فرض کنید (x) f θ خانواده اي از توابع چگالی داراي خاصیت MLR در T و F θ نشان دهندة تابع توزیع آمارة T متناظر با مقدار θ باشد. در این صورت اگر θ < θ باشد خواهیم داشت: F θ (t) F θ (t), t; یعنی (t) F θ به ازاي هر t نسبت به θ نزولی است. قضیە 2.5. فرض کنید T یک آماره با تابع توزیع پیوستە F θ متناظر با مقدار θ باشد که (t) F θ به ازاي هر t نسبت به θ نزولی است. همچنین فرض کنید α = α + α که < α < است. اگر (t) θ L و (t) θ U در روابط F θu (t)(t) = α, F θl (t)(t) = α صدق کنند )] (T [θ L (T ), θ U یک بازة اطمینان براي θ با ضریب اطمینان α خواهد بود. جدول 1. میانگین طول بازه هاي اطمینان و احتمال پوشش آن ها براي طرح هاي مختلف سانسور و مقادیر مختلف θ و t
اندیشە آماري سال بیست و یکم شمارة اول بهار و تابستان 1395 شمارة پیاپی 41 صص 87-81 85 r θ t میانگین طول احتمال پوشش (,,,, ) 1 3 4 5 3 4 5 (,,,, ) 1 3 4 5 3 4 5 (,,,, ) 1 3 4 5 3 4 5 (,,,, ) 1 3 4 5 3 4 5 ˆθ = و R = ˆθ < یا ˆθ >. 7 مثال هاي کاربردي در این بخش دو مثال کاربردي براي اجراي آزمون فرضیه و تعیین فاصلە اطمینان بیان می شود. مثال 1.7. داده هاي موجود در بارلو و همکاران [3] را در نظر بگیرید. داده ها شامل 6 مشاهدة,,,,, با بردار حذفیات ) r = (,,,,, و زمان آستانه اي t = هستند. فرض کنید هدف انجام دادن آزمون H : θ = در مقابل H : θ با فرض α = α = باشد. در این حالت چون مقدار θˆ در ناحیە رد آزمون قرار ندارد دلیلی براي رد فرضیە صفر وجود ندارد. مقادیر بحرانی با نرم افزار Mathematica محاسبه شده اند. برنامە محاسبە مقادیر بحرانی در پیوست آمده است. مثال 2.7. شرایطی مشابه با مثال 1.7 را در نظر بگیرید. فرض کنید هدف تعیین یک بازة اطمینان براي θ با ضریب اطمینان باشد. در این حالت با قرار دادن α = α = در روابط قضیە 2.5 بازة اطمینان به صورت ] [,
86 آزمون فرضیه و بازة اطمینان دقیق براي میانگین توزیع نمایی... حسین نادب و حمزه ترابی, {j, i, m}]]; gamma[[m + 1]] = 0; n = m + Total[r]; g = gamma t0; f[t_, theta_, t0_] := 1.(1 - Exp[-n t0.theta]) (Sum[Product[gamma[[j]], {j, 1, d}] (d t0^(d - 1)).(Factorial[d - 1] (gamma[[1]] - gamma[[d + 1]]) theta^d)* BSplineBasis[{d - 1, Sort[g[[1 ;; d + 1]]]}, 0, d t] Exp[-d t.theta], {d, 1, m}] ); F[k_] := Integrate[f[t, theta, t0], {t, 0, k}]; FindRoot[F[k] ==.025, {k, 10}] FindRoot[F[k] ==.975, {k, 50}] برنامە محاسبە بازة اطمینان در مثال 2.7 r = {0, 0, 0, 0, 0, 4}; theta = 30; t0 = 50; m = Length[r]; gamma = Range[m + 1]; For[i = 1, i < m + 1, i++, gamma[[i]] = m - i + 1 + Sum[r[[j]], {j, i, m}]]; gamma[[m + 1]] = 0; n = m + Total[r]; g = gamma t0; f[t_, theta_, t0_] := 1.(1 - Exp[-n t0.theta]) (Sum[Product[gamma[[j]], {j, 1, d}] (d t0^(d - 1)). (Factorial[d - 1] (gamma[[1]] - gamma[[d + 1]]) theta^d)* BSplineBasis[{d - 1, Sort[g[[1 ;; d + 1]]]}, 0, d t] Exp[-d t.theta], {d, 1, m}] ); th = 43.17; F[theta_] := Integrate[f[x, theta], t0], {x, 0, th}]; FindRoot[F[theta] ==.975, {theta, 20}] FindRoot[F[theta] ==.025, {theta, 120}] به دست می آید. برنامە محاسبە بازة اطمینان در پیوست آمده است. نتیجه گیري در این مقاله روشی براي اجراي آزمون فرضیه و به دست آوردن فاصلە اطمینان براي میانگین توزیع نمایی تحت سانسور دورگە پیش روندة نوع اول پیشنهاد شد. سپس با استفاده از شبیه سازي عملکرد بازة اطمینان پیشنهادي مورد ارزیابی قرار گرفت و سرانجام روش هاي پیشنهادي براي یک مجموعه داده به کار گرفته شد. پیوست برنامە محاسبە مقادیر بحرانی در مثال 1.7 r = {0, 0, 0, 0, 0, 4}; theta = 30; t0 = 50; m = Length[r]; gamma = Range[m + 1]; For[i = 1, i < m + 1, i++, gamma[[i]] = m - i + 1 + Sum[r[[j]] [1] Ali, M.M. (1973). Content of the frustum of simplex. Pacific Journal of Mathematics, 48, 313 322. مراجع [2] Balakrishnan, N. and Basu, A.P. (eds.) (1995). The Exponential Distribution: Theory, Methods, and Applications. Gordon and Breach Science, Newark, N.J. [3] Barlow, R. E., Madansky, A., Proschan, F., and Scheuer, E.M. (1968). Statistical estimation procedures for the burn-in process. Technometrics, 10, 51 62. [4] Burden, R.L. and Faires, J.D. (2011). Numerical Analysis, Ninth Edition. Brooks.Cole, Cencag Learning, Boston. [5] Casella, G. and Berger, R.L. (2002) Statistical Inference, Second Edition. Duxbury, California. [6] Chen, S.M. and Bhattacharyya, G.K. (1988). Exact confidence bounds for an exponential parameter under hybrid censoring. Communications in Statistics: Theory and Methods, 16, 2429 2442. [7] Childs, A., Balakrishnan, N. and Chandrasekar, B. (2012). Exact distribution of the MLEs of the parameters and of the quantiles of two-parameter exponential distribution under hybrid censoring. Statistics, 46, 441 458.
اندیشە آماري سال بیست و یکم شمارة اول بهار و تابستان 1395 شمارة پیاپی 41 صص 87-81 87 [8] Childs, A., Chandrasekar, B., and Balakrishnan, N. (2008). Exact likelihood inference for an exponential parameter under progressive hybrid censoring schemes. In Statistical models and methods for biomedical and technical systems, 319-330. Birkhäuser Boston. [9] Childs, A., Chandrasekar, B., Balakrishnan, N. and Kundu, D. (2003). Exact likelihood inference based on Type-I and Type-II hybrid censored samples from the exponential distribution. Annals of the Institute of Statistical Mathematics, 55, 319 330. [10] Cramer, E. and Balakrishnan, N. (2013). On some exact distributional results based on Type-I progressively hybrid censored data from exponential distributions. Statistical Methodology, 10, 128-150. [11] Curry, H. and Schoenberg, I. (1966). On Pólya frequency functions IV: the fundamental spline functions and their limits. Journal d Analyse Mathematique, 17, 71-107. [12] De Boor, C. (2001). A Practical Guide to Splines, Revised Edition. Springer, New York. [13] De Boor, C. (1976). Splines as linear combinations of B-splines. A survey. Lorentz, G.G., Chui, C.K. and Schumaker, L.L. (eds.), Approximation Theory II. Academic Press, New York, pp. 1 47. [14] Epstein, B. (1954). Truncated life tests in the exponential case. The Annals of Mathematical Statistics, 25, 555 564. [15] Kundu, D. and Joarder, A. (2006). Analysis of Type-II progressively hybrid censored data. Computational Statistics and Data Analysis, 50, 2509 2528. [16] Lehmann, E.L. and Romano, J.P. (2005). Testing Statistical Hypotheses, Third Edition. Springer, New York.